FILTER MODE ACTIVE

#глубокое обучение

Найдено записей: 14

#глубокое обучение07.08.2025

Google AI выпустила DeepPolisher: новый инструмент на базе глубокого обучения для точной коррекции ошибок в сборках геномов

Google AI и Институт геномики UC Santa Cruz выпустили DeepPolisher — инструмент глубокого обучения, значительно снижающий ошибки в сборках геномов и повышающий точность эталонных человеческих геномов.

#глубокое обучение02.08.2025

MIT представил метод стабильного обучения трансформеров с помощью липшицевых ограничений и оптимизатора Muon

Исследователи MIT разработали метод стабильного обучения больших трансформеров через липшицевы ограничения и спектральную регуляцию весов с оптимизатором Muon, исключая необходимость нормализаций.

#глубокое обучение01.08.2025

Falcon-H1: прорывная гибридная модель, конкурирующая с гигантами на 70 миллиардов параметров

Falcon-H1 от TII — гибридная модель, объединяющая внимание и модели состояний, достигающая результатов, сопоставимых с ведущими LLM на 70 миллиардов параметров, с оптимизацией эффективности и масштабируемости.

#глубокое обучение27.07.2025

GenSeg: революция в сегментации медицинских изображений с помощью генеративного ИИ при ограниченных данных

GenSeg — инновационный генеративный ИИ-фреймворк, значительно повышающий качество сегментации медицинских изображений при нехватке размеченных данных за счет создания оптимизированных синтетических наборов.

#глубокое обучение07.07.2025

Радиальное внимание: снижение затрат на видео-диффузию в 4,4 раза без потери качества

Радиальное внимание представляет новый механизм разреженного внимания, который сокращает затраты на обучение в 4,4 раза и время инференса в 3,7 раза в видео-диффузионных моделях, позволяя создавать более длинные видео без потери качества.

#глубокое обучение26.06.2025

Google DeepMind представила AlphaGenome: прорывная модель глубокого обучения для предсказания влияния мутаций в ДНК

Google DeepMind представила AlphaGenome — новую модель глубокого обучения, которая с высокой точностью предсказывает регуляторное влияние мутаций в ДНК по множеству биологических параметров, превосходя существующие решения.

#глубокое обучение27.05.2025

Революция в нейросетях: дифференцируемые MCMC-слои для комбинаторной оптимизации

Новая AI-технология представляет дифференцируемые MCMC-слои, позволяющие нейросетям эффективно обучаться с приближенными комбинаторными решателями и значительно улучшать результаты в сложных задачах оптимизации, например маршрутизации.

#глубокое обучение20.05.2025

Meta представляет KernelLLM: 8-миллиардная модель, преобразующая PyTorch модули в эффективные Triton GPU ядра

Meta выпустила KernelLLM — 8-миллиардную модель, которая автоматизирует преобразование PyTorch модулей в эффективные Triton GPU ядра, превосходя более крупные модели в бенчмарках.

#глубокое обучение25.04.2025

Забывающий Трансформер (FoX): Революция в Длинных Контекстах Языкового Моделирования с Эффективным Управлением Памятью

Исследователи из Mila и Университета Монреаля представили FoX — новую версию трансформера с обучаемыми forget gate, которая улучшает качество и эффективность моделирования длинных контекстов без потерь в скорости.

#глубокое обучение23.04.2025

Оптимизатор Muon от Microsoft значительно ускоряет гроккинг в трансформерах

Исследователи Microsoft показали, что оптимизатор Muon существенно ускоряет гроккинг в моделях трансформеров, обеспечивая более быстрый переход от запоминания к обобщению по сравнению с AdamW.